检索结果

Select

1. 面向DCU非一致控制流的编译优化

杨小艺, 赵荣彩, 王洪生, 韩林, 徐坤坤

《计算机应用》唯一官方网站 2023, 43 (10): 3170-3177. DOI: 10.11772/j.issn.1001-9081.2022091338

摘要（177）

HTML （10）

PDF （4315KB）（77）

国产DCU采用单指令多线程（SIMT）的并行执行模型，在程序执行时核函数内会产生非一致控制流，导致线程束中的线程部分只能串行执行，即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题，提出一种减少线程束分化时间的编译优化方法——部分控制流合并（PCFM）。首先，通过散度分析找到同构且含有大量相同指令和相似指令的可融合发散区域；其次，统计合并后节省的指令周期百分比，从而评估可融合发散区域的融合盈利；最后，查找对齐序列，并合并有收益的可融合发散区域。在DCU上使用PCFM测试从图形处理器（GPU）基准测试套件Rodinia和经典的排序算法中选择的测试用例，实验结果表明，PCFM对测试用例能够取得1.146的平均加速比，与分支融合+尾合并方法相比，使用PCFM的加速比平均提高了5.72%。可见，所提方法减少线程束分化的效果更好。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 分段约束的超字并行向量发掘路径优化算法

徐金龙, 赵荣彩, 韩林

计算机应用 2015, 35 (4): 950-955. DOI: 10.11772/j.issn.1001-9081.2015.04.0950

摘要（769）

PDF （877KB）（576）

超字并行(SLP)是一种针对基本块的向量并行发掘方法,结合循环展开可以发掘更多的并行性,但同时也会产生过多的发掘路径。针对上述问题,提出了一种分段约束的SLP发掘路径优化算法;采用分段的冗余删除方法,来保证冗余删除后段的同构性。采用段间的SLP发掘,来约束发掘路径;最后进行pack调整来处理访存重叠的情况。实验结果表明,该方法有效增强了SLP向量化功能,对于测试程序,向量化的平均加速比接近2。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于改进证据理论的态势评估方法

汪永伟刘育楠赵荣彩司成邱卫

计算机应用 2014, 34 (2): 491-495.

摘要（449）

PDF （721KB）（494）

证据理论是实现基于规则的态势感知主要方法之一。然而，证据理论在多源多证据合成时存在悖论问题。针对此问题，通过相异度计算对证据重要性度量与修正，提出了一种基于改进证据理论的态势评估方法，该方法包括规则度量、证据修正、规则融合和态势决策等四个阶段。实验表明，该方法能够避免利用证据理论进行态势融合中的悖论问题，在态势评估效率和准确性等方面优于Dempster、Yager和Leung等典型方法。

相关文章 | 多维度评价

Select

4. 非正规化循环的单指令多数据向量化

侯永生赵荣彩高伟高伟

计算机应用 2013, 33 (11): 3149-3154.

摘要（542）

PDF （948KB）（320）

针对非正规化循环的上下界、步长等循环信息不确定的问题，解决了循环条件为逻辑表达式、增量减量语句和do-while循环的正规化问题。对不能正规化的循环提出了一种展开压紧算法，并用超字并行向量化方法发掘展开压紧的结果。实验结果表明，与现有的非正规化循环的单指令多数据(SIMD)向量化方法相比，所提出的转换方法和展开压紧方法能够更好地发掘非正规化循环的向量化特性，生成代码的性能加速比提高了6%以上。

相关文章 | 多维度评价

Select

5. 基于循环分块的流水粒度优化算法

刘晓娴赵荣彩丁锐李雁冰

计算机应用 2013, 33 (08): 2171-2176.

摘要（646）

PDF （906KB）（426）

当计算划分层迭代数目较大，或是循环体单次迭代工作量较大，但可用的并行线程数目较小时，传统的基于循环分块的流水粒度优化方法无法进行处理。为此，提出一种基于循环分块减小流水粒度的方法，并根据流水并行循环的代价模型实现最优流水粒度的求解，设计实现了一个流水计算粒度的优化算法。对有限差分松弛法(FDR)的波前循环和时域有限差分法(FDTD)中典型循环的测试表明，与传统的流水粒度选择方法相比，所提算法能够得到更优的循环分块大小。

参考文献 | 相关文章 | 多维度评价

Select

6. 面向异构多核处理器的并行代价模型

黄品丰赵荣彩姚远赵捷

计算机应用 2013, 33 (06): 1544-1547. DOI: 10.3724/SP.J.1087.2013.01544

摘要（640）

PDF （634KB）（766）

现有的并行代价模型大多是面向共享存储或分布存储结构设计的，不完全适合异构多核处理器。为解决这个问题，提出了面向异构多核处理器的并行代价模型，通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响，提高加速并行循环识别的准确性。实验结果表明，提出的并行代价模型能有效识别加速并行循环，将其识别结果作为后端生成并行代码的依据，可有效提高并行程序在异构多核处理器上的性能。

参考文献 | 相关文章 | 多维度评价

Select

7. 面向DSP的超字并行指令分析和冗余优化算法

索维毅赵荣彩姚远刘鹏

计算机应用 2012, 32 (12): 3303-3307. DOI: 10.3724/SP.J.1087.2012.03303

摘要（978）

PDF （760KB）（578）

如今单指令多数据流(SIMD)技术在数字信号处理器（DSP）上得到了广泛的应用，现有的向量化编译器大多都实现了自动向量化的功能，但是编译器并不适合支持DSP为特征的SIMD自动向量化，主要由于DSP复杂的指令集、特有的寻址模型，以及依赖关系或者数据非对齐等原因而导致向量化效率不高。为了解决此问题，在基于Open64的超字并行(SLP)自动向量化编译系统后端，对SLP自动向量化中的指令分析和冗余优化算法进行了添加和改进，生成更加高效的向量化源程序。实验结果表明，该优化方法能有效提高DSP性能并降低功耗。

相关文章 | 多维度评价

Select

8. 分块存储的滑动窗口数据重用技术

刘陶刚赵荣彩姚远瞿进

计算机应用 2010, 30 (05): 1371-1375.

摘要（388）

PDF （622KB）（1074）

滑动窗口操作在基于可重构系统的典型应用（如图像处理、模式识别和数字信号处理等）中广泛采用，但是当前生成的滑动窗口电路，存在着存储冗余、操作等待等问题，导致执行效率不高。从增大滑动窗口数据吞吐量出发，提出了分块存储的滑动窗口数据重用方法，通过并行存取窗口数据，来减少存储器访问时间，加速滑动窗口执行。实验表明，在三个滑动窗口典型应用实例中，采用该方法生成的硬件电路能够将程序性能分别提高7.0~9.0倍。

相关文章 | 多维度评价

Select

9. 静态二进制翻译中回调函数逆向恢复技术研究

丁松阳赵荣彩

计算机应用

摘要（1570）

PDF （594KB）（871）

回调函数的逆向恢复是静态二进制翻译的一个难点。针对使用C后端的静态二进制翻译框架，提出并实现回调函数逆向恢复方法，该方法结合代码间隙分析，在后端C代码生成过程中插入映射源回调函数地址到目标机函数地址的代码。相对于使用解释器的方法，该方法具有实现简洁，在目标机上运行速度更快的优点。

相关文章 | 多维度评价

Select

10. 基于线性不等式的数据划分方法的优化

董春丽赵荣彩杜澎王峥

计算机应用

摘要（1363）

PDF （713KB）（816）

计算和数据划分是串行程序并行化时所要解决的一个重要问题，如何对程序中引用的数据进行合理的分布以最大限度的发现程序的并行性减少数据重分布的通信开销，是并行编译优化的重点。给出的数据和计算的优化分解方法是基于Anderson-Lam的分解算法上改进得到的。根据Anderson-Lam的算法得到数据和计算划分后，以线性不等式的形式表示，然后通过分析循环嵌套中能够进行边界冗余的只读数组，重新构造数据划分不等式，根据此不等式进行数据分布，实现具有边界冗余的只读数组的数据划分，有效地减少了数据收发的通信量。

相关文章 | 多维度评价

Select

11. 二进制翻译中的函数返回类型恢复技术

吴伟峰赵荣彩齐宁杨克峤

计算机应用

摘要（1764）

PDF （804KB）（778）

函数返回类型恢复分为库函数和用户函数返回类型恢复两类。分析IA-64体系结构在函数调用和返回方面的特性得知,用户函数返回类型恢复不是只能从调用者的角度进行分析，还可从被调用者的角度进行分析。综合两种分析方法的优缺点,提出了一种全新的函数返回类型恢复方法。介绍了静态二进制翻译系统ITA中基于控制流和数据流分析的函数返回类型恢复技术，并给出相应的实现算法。由IA-64体系结构的实例验证证明，该方法是一种实用的函数返回类型恢复方法。

相关文章 | 多维度评价

Select

12. MPI通信代码自动生成算法

杜澎赵荣彩董春丽

计算机应用

摘要（1333）

PDF （561KB）（865）

对于高性能并行计算机而言，如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据Saman P.Amarasinghe和Lam的定理，实现了一种并行化识别工具中MPI（Message Passing Interface）并行化代码自动生成技术的算法，并对该算法的性能进行分析。

相关文章 | 多维度评价

Select

13. IA-64软件流水的反流水算法研究

崔平非庞建民赵荣彩崔雪冰

计算机应用

摘要（1705）

PDF （679KB）（755）

软件流水是一种开发循环程序指令级并行性的技术, 它通过并行执行连续的多个迭代来加快循环的执行速度。而在逆向工程中，软件流水却为逆向翻译带来了困难。为此，基于IA-64平台，提出了一种反流水算法，针对循环中包含软件流水的汇编代码进行处理，将其反向转换成语义等价的串行代码，并通过实验验证了该算法的有效性,为在二进制翻译中处理软件流水代码奠定了基础。

相关文章 | 多维度评价

Select

14. IA-64二进制翻译中指令束特性的消除技术

杨克峤;赵荣彩;崔平非;朱晓珺

计算机应用

摘要（1847）

PDF （767KB）（745）

目前对处理器速度的追求促使指令集体系结构不断发展，但是软件的支持却不能与其匹配，造成新体系结构推广的困难，研究、解决代码迁移问题的二进制翻译方法应运而生。文中介绍了二进制翻译中解码器的功能，并结合IA-64的指令特点，设计出基于指令束的解码算法。根据测试中发现该算法存在的问题，提出了改进方案，消除束的特性，给每条指令赋予唯一地址并按此地址进行解码。在IA-64至Alpha的二进制翻译课题中，对该算法进行了工程实现。

相关文章 | 多维度评价

Select

15. 逆向工程中基于投机的反向优化技术研究

苏铭;宋宗宇;赵荣彩

计算机应用

摘要（1851）

PDF （827KB）（776）

投机机制通过改善内存操作效能提高程序的执行性能，但是它需要大量复杂的代码处理投机失败及恢复，增加了程序的理解和投机代码再工程的复杂性。文中提出了一个算法，在安腾的二进制代码中消除投机指令并保证程序的语义，使得投机消除后的程序更容易理解,更易于应用传统逆向工程的技术进行代码再工程。

相关文章 | 多维度评价

Select

16. 二进制翻译中的库函数识别技术研究

齐宁; 付文; 赵荣彩

计算机应用

摘要（1483）

PDF （710KB）（1116）

体系结构的不断发展给软件开发者带来了巨大的风险，造成了新体系结构推广的困难，而二进制翻译技术使得可执行代码可自动迁移到新的体系结构。介绍了在开发一个静态二进制翻译系统（I2A翻译系统）中的库函数识别技术，并提出了解决库函数识别问题的新的方法。基于IA-64体系结构的调用约定及实例分析证明,该方法是一种简单实用的库函数识别方法，经I2A系统验证是有效的。

相关文章 | 多维度评价

Select

17. 代码翻译中Case语句的识别和恢复

苏铭;赵荣彩;齐宁

计算机应用 2005, 25 (10): 2439-2440.

摘要（1263）

PDF （562KB）（1337）

提出了在开发IA64二进制翻译系统中采用的n条件分支跳转表和目标地址恢复技术。着重论述了该技术的核心——过程内切片和表达式替换，以及针对IA64特性的改进算法。

相关文章 | 多维度评价